Programación en Ciencias Sociales (CPO3523)




AndrƩs Cruz



2020-04-20 L



Visualización de datos

Plan de hoy

  • Repaso ggplot2
  • Preceptos de visualización de datos
  • MĆ”s ggplot2
  • Solemne 1

Repaso ggplot2

Tipos de grƔficos

  • Univariados
    • Categórica.
      • Barras – geom_bar()
    • NumĆ©rica.
      • Histograma – geom_histogram()
  • Bivariados
    • Distribución numĆ©rica + categórica.
      • Boxplots por categorĆ­a – geom_boxplot()
    • Conteo numĆ©rica + categórica.
      • Columnas – geom_col()
    • NumĆ©rica + numĆ©rica.
      • Puntos / dispersión – geom_point()

Datos

## # A tibble: 324 x 17
##    comuna comuna_id region n_encuestados poblacion porc_rural edad_prom
##    <chr>      <dbl>  <dbl>         <int>     <dbl>      <dbl>     <dbl>
##  1 Iquiq…      1101      1          6447    180856       2.06      34.6
##  2 Alto …      1107      1          3015    126971       0         28.8
##  3 Pozo …      1401      1           255     17259      27.6       34.4
##  4 CamiƱa      1402      1            82       832     100         36.6
##  5 Huara       1404      1           171      3488     100         39.2
##  6 Pica        1405      1           180     16357      19.8       44.7
##  7 Antof…      2101      2          5473    387454       0         34.2
##  8 Mejil…      2102      2           169     11777       0         32.5
##  9 Sierr…      2103      2            90      2103     100         32.2
## 10 Taltal      2104      2           224      8789       7.79      35.4
## # … with 314 more rows, and 10 more variables: porc_mujeres <dbl>,
## #   porc_profesionales <dbl>, porc_pobres_ing <dbl>, porc_pobres_md4 <dbl>,
## #   porc_uso_diario_inet <dbl>, porc_particip_iglesia <dbl>,
## #   porc_mapuche <dbl>, alcalde_nombre <chr>, alcalde_coalicion <chr>,
## #   alcalde_reelecto <dbl>

Barras

Histograma

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Boxplots por categorĆ­a

Columnas (I)

Columnas (II)

Puntos

Etiquetas

Preceptos de visualización de datos

Audiencia

Fuente: Holmes en [Healy (2018, cap. 1)](http://socviz.co/lookatdata.html#lookatdata).

Fuente: Holmes en Healy (2018, cap. 1).

Como en todo ejercicio de comunicación, es crucial entender quién es nuestro receptor. ¿Academia? ¿Público general? ¿Niños(as)? ¿Técnicos(as)?

Reducir la complejidad

Usualmente queremos maximizar el ratio de información/tinta (Healy, 2018, cap. 1), lo que implica evitar 3D/Colores/formas que no registren información o sean redundante.

Percepciones y dimensiones (I)

Percepciones y dimensiones (II)

TamaƱo de los elementos

Escalas

Etiquetas (I)

Queremos que las etiquetas de texto en nuestros grƔficos sean autoexplicativas y ayuden a la lectura. Es importante colocar la fuente, si corresponde.

Etiquetas (II)

Los elementos de texto de un grÔfico también guían al receptor a propósito de qué elementos concentrar su atención.

Colores

  • Las paletas de colores son importantes para transmitir correctamente información.

  • En general, hay paletas secuenciales, divergentes y cualitativas. Veamos Color Brewer 2.0. Siempre queremos utilizar la correcta para nuestra visualización.

  • Hay paletas mĆ”s amigables con daltónicos(as) que otras. Para paletas cualitativas, una buena fuente es Color Brewer.

  • En tĆ©rminos de paletas de colores secuenciales, viridis parece ser la mĆ”s óptima.

Gusto y sentido comĆŗn

Promedio de esperanza de vida por continente, 2007. Fuente: [Healy (2018)](http://socviz.co/lookatdata.html#what-makes-bad-figures-bad)

Promedio de esperanza de vida por continente, 2007. Fuente: Healy (2018)